ChatApp 的推理能力:超越人类智慧?
这两天,最令我震惊的不是 ChatGPT 能完成日常工具需求,或是其渊博浩瀚的知识库(虽然常常也不靠谱),也不是它对语料无可挑剔的处理结果。
令人震惊的,建立在“ 完成语言 ”这个看似简单的行为上,它展示出基本的思维能力。这种能力完全可能展开成为一种长考,或者在接入真实世界信息以后,展现出超越于大多数人之上的推理和判断能力。
现在,它的思维模型还非常简单。建立在基础模型之上,它可以思考这样的过程,例如给定提示词:
我们试着来玩分苹果,看看拿几次结束。
让我们来分 24 个苹果,每次拿走 8 个。分完为止。
第 1 次拿走 8 个,剩下 16 个。
第 2 次拿走 8 个,剩下 8 个。
第 3 次拿走 8 个,剩下 0 个。
剩下不足 8 个,结束。
答:拿 3 次以后结束,最后剩下 0 个。
让我们来分 36 个苹果,每次拿走 7 个。分完为止。
第 1 次拿走 7 个,剩下 29 个。
第 2 次拿走 7 个,剩下 22 个。
第 3 次拿走 7 个,剩下 15 个。
第 4 次拿走 7 个,剩下 8 个。
第 5 次拿走 7 个,剩下 1 个。
第 6 次拿走 7 个,不足 7 个,拿走剩下的 1 个, 剩下 0 个。
答:拿 6 次以后结束,最后剩下 0 个。
现在让我们来分 45 个苹果,每次拿走 10 个,分完为止:
ChatGPT 会如何应答呢?这是它的结果:
第 1 次拿走 10 个,剩下 35 个。
第 2 次拿走 10 个,剩下 25 个。
第 3 次拿走 10 个,剩下 15 个。
第 4 次拿走 10 个,剩下 5 个。
第 5 次拿走 5 个,剩下 0 个。
答:拿 5 次以后结束,最后剩下 0 个。
让我们继续问:
现在让我们来分 25 个苹果,每次拿走 12 个,分完为止:
ChatGPT 回答:
第 1 次拿走 4 个,剩下 21 个。
第 2 次拿走 4 个,剩下 17 个。
第 3 次拿走 4 个,剩下 13 个。
第 4 次拿走 4 个,剩下 9 个。
第 5 次拿走 4 个,剩下 5 个。
第 6 次拿走 4 个,剩下 1 个。
第 7 次拿走 1 个,剩下 0 个。
答:拿 7 次以后结束,最后剩下 0 个。
当然,这只是其中最为简单的一种做法。把一个相对复杂的语言交流不断分解,直到对接上 ChatGPT 的丰富语感,以直觉的方式完成任务。
回过头看看我们自己,其实我们不也是这样工作的吗?一个小孩子计算 1+1 的时候,同样依赖于直觉。
仔细看 ChatGPT 的两次回答,ChatGPT 直接忽略了我在题词里写的:“拿走剩下的 1 个, 剩下 0 个。” 这个过程。在它的推理过程里,这个操作被内化,没有被表述。这表明 ChatGPT 不仅理解这句话的含义,同时把操作融入到自己的语义推理之中。
现在, ChatGPT 或者 OpenAI API 的输入 Token 限制是 4000 左右的词汇。想象一下,如果这变成 1G 或者 1T,搭配 AI 算力八个月翻一倍的“算摩定律”,它的思维深度和广度都会到达什么程度?
简而言之,我们可以畅想,除了现在百花齐放的各种工具类 ChatApp 和 Prompt 大爆炸,我们真正需要面对的是未来 N*18 个月里所逐渐涌现的思考型 ChatApp,而它们正从科幻小说、数学论文里暗含隐藏的逻辑,从地平线上,逐渐展现它们的身姿。
我感到,我有一只脚,已经迈入了科幻的大门;但这种感受,却那么真实。
END
PS1
原文标题:作为工具存在的 ChatApp 和 作为思想存在的 ChatApp
ChatGPT 推荐的其他标题:
“ChatApp:未来思考的新载体?”
“ChatApp如何展示人工智能的思考能力?”
“ChatApp:是工具还是思想?还是两者兼备?”
“ChatApp的思维模型简单到令人惊叹!”
“ChatApp:解放思维的新方法?”
“ChatApp的推理能力:超越人类智慧?”
“ChatApp:预示着人工智能进入思考时代?”
“ChatApp的未来:超越语言的智慧?”
PS2
如果你尝试和 ChatGPT 玩儿这个游戏,它的回复可能会不稳定。可以尝试从完整的 Prompt 重新开始游戏。